VERDI: Estimación de confianza de una sola llamada para jueces LLM basados en verificación mediante inferencia descompuesta
VERDI mejora la confianza en LLM judges usando inferencia descompuesta. Descubre cómo optimizar la evaluación de modelos de lenguaje.